期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于共享注意力的多智能体强化学习订单派送
黄晓辉, 杨凯铭, 凌嘉壕
《计算机应用》唯一官方网站    2023, 43 (5): 1620-1624.   DOI: 10.11772/j.issn.1001-9081.2022040630
摘要339)   HTML10)    PDF (1392KB)(176)    收藏

网约车因方便、快捷成为现今人们出行热门之选,如何更高效地派送合适的订单将乘客送到目的地是如今研究的热点。许多研究着重于训练单智能体,再由它统一分配订单,车辆本身并不参与决策。针对以上问题,提出一种基于共享注意力的多智能体强化学习(SARL)算法。该算法将订单派送问题建模为一个马尔可夫决策过程,运用多智能体强化学习,通过集中训练、分散执行的方式让每个智能体均成为决策者;同时加入共享注意力机制,让智能体彼此共享信息并合作。最后,在不同尺度地图、不同乘客数以及不同车辆数情形下与完全随机匹配(Random)、贪婪算法(Greedy)、多智能体强化学习算法IDQN和混合Q值网络(QMIX)进行对比。结果显示,在固定和可变的车辆与乘客组合情况下,SARL算法在三个不同尺度地图(100×100、10×10和500×500)的时间效率均达到了最优,验证了算法的泛化性能和稳定性。SARL算法可以优化车辆和乘客的配对,减少乘客等待时间,提升乘客满意度。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于聚类分析的可信网络管理模型
谢洪安, 李栋, 苏旸, 杨凯
计算机应用    2016, 36 (9): 2447-2451.   DOI: 10.11772/j.issn.1001-9081.2016.09.2447
摘要524)      PDF (936KB)(374)    收藏
针对可信网络中动态信任模型对终端用户行为信任评估有效性问题,提出一种新的基于聚类分析的可信网络管理模型。该模型在传统信任模型的基础上引入聚类分析方法,从行为预期的角度研究用户的行为信任。通过对用户的历史行为数据进行聚类分析以构建行为预期,并利用行为预期评估用户行为,最后以信任评估结果为依据实现对网络中的用户的管理。实验表明该模型可以对长期接入的正常用户产生稳定的信任评估结果,同时迅速发现并隔离恶意用户,对可信用户与不可信用户有较高的区分度,与传统的信任模型相比具有更高的准确度及效率,达到了提高网络可信性的目的。
参考文献 | 相关文章 | 多维度评价
3. 电子商务中客户评价策略选择的演化博弈分析
刘大福, 苏旸, 谢洪安, 杨凯
计算机应用    2016, 36 (12): 3269-3273.   DOI: 10.11772/j.issn.1001-9081.2016.12.3269
摘要935)      PDF (746KB)(440)    收藏
针对电子商务信任评价机制中难以采取有效激励措施使客户进行真实评价的问题,根据客户对商家的评价行为具有不完全信息和有限理性特点,建立演化博弈模型对信任模型的激励措施进行分析和改进。该模型运用复制动态机制模拟客户的策略选择演化,对现有激励措施下演化稳定策略(ESS)的存在性进行论证,并基于系统动力学增加补偿收益进行改进。基于NetLogo系统动力学模块建模实验表明,相较于基于兴趣群组的信任激励模型(IGTrust),改进后的激励措施得到ESS并成功预测和控制了客户评价策略;同时模型具备鲁棒性,应对7%客户评价策略变异也能够保持演化稳定状态。
参考文献 | 相关文章 | 多维度评价
4. 无线传感器网络中同步补偿机制的研究与应用
陈乔 张毅坤 杨凯峰 张彤 夏辉
计算机应用    2010, 30 (4): 892-894.  
摘要1532)      PDF (786KB)(1274)    收藏
在由事件触发、部分节点同步的无线传感器网络应用中,传统时间同步算法周期性全网同步存在不必要的能耗问题。通过分析现有的时间同步机制,提出一种基于事件触发的时间同步补偿算法,该算法通过分别统计出沿途的累计处理时延并补偿传输延时的方式实现部分节点同步。实验结果表明,在兴趣节点数量较少和事件发生频率较低的情况下该算法具有良好的同步效果和节能性。
相关文章 | 多维度评价
5. 网格系统中信息流到服务数据封装的研究与应用
廖斌;黄永忠;杨凯
计算机应用    2005, 25 (11): 2698-2700.  
摘要1446)      PDF (610KB)(1336)    收藏
在OGSA框架中,一切资源都被抽象为服务,而资源信息则被描述成为服务数据。以面向服务的思想,分析了网格系统中信息流到服务数据封装的运行机制,并给出了一个完成集群系统中主机信息到服务数据封装的具体应用。
相关文章 | 多维度评价
6. 基于需求模式自适应匹配的间歇性需求预测方法
范黎林 曹富康 王琬婷 杨凯 宋钊瑜
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2023091372
预出版日期: 2024-01-31